JSAI2026 VQ-VAEとUNMT による創発言語と自然言語の翻訳
(予習)
テーマ
マルチエージェント強化学習で生じる「創発言語」を、人間が読める自然言語に翻訳する研究
エージェントの学習方策には介入せず、外部翻訳器として解釈可能性を付与する
背景課題
エージェント同士はタスクに最適化された独自の通信表現を獲得する
人間には解釈しにくく、人間・LLM・強化学習エージェントの協調を難しくする
提案
創発言語を直接自然言語に寄せるのではなく、学習済みエージェントの通信を後段で翻訳
VQ-VAEで連続ベクトルの創発言語を離散トークン列に変換
UNMTで、創発言語トークン列と自然言語メッセージの間の翻訳モデルを学習
対訳データを使わず、創発言語側・自然言語側それぞれの単言語コーパスから翻訳を構築
要チェック daiiz.icon
VQ-VAEによる離散化が、どの程度「意味のあるトークン化」になっているか
UNMTが本当に創発言語の意味を翻訳しているのか、それとも自然言語らしい文を当てているだけか
気になる daiiz.icon
離散化する目的
語彙数を有限にするため
離散化しないと実数ベクトル(埋め込み)を扱わないといけない。これには無限の語彙が必要になる。
創発言語を離散トークン列に変換する点は、Semantic ID / SID の観点からも興味深い
VQ-VAEで得られたコード列が、タスク上の状態や意図とどの程度対応しているのか
離散表現を、翻訳だけでなく検索・分類・可視化に使える可能性
自然言語に翻訳することで、創発言語本来の情報はどれほど丸められるか
#聴講メモ